AI
Microsoft erweitert KI-Portfolio mit neuen Phi-3.5-Modellen: Ein großer Schritt in Richtung leistungsstarker Multimodalität: Microsoft amplia il portfolio di AI con i nuovi modelli Phi-3.5: un grande passo verso una multimodalità potente
Microsoft hat drei neue Modelle der Phi-3.5-Serie vorgestellt, die auf dem Weg zur Spitzenposition in der KI-Entwicklung bedeutende Fortschritte markieren.
Microsoft ha presentato tre nuovi modelli della serie Phi-3.5, che segnano progressi significativi sulla strada verso la posizione di vertice nello sviluppo dell'IA.
Microsoft continua la sua impressionante serie di successi nel campo dell’intelligenza artificiale e ha annunciato oggi il rilascio di tre nuovi modelli della serie Phi-3.5. Questi modelli, caratterizzati da funzionalità avanzate di multimodalità e multilinguismo, mirano a rivoluzionare ulteriormente il mercato delle applicazioni basate sull'IA. I modelli sono stati resi disponibili su Hugging Face con una licenza MIT brandizzata Microsoft, offrendo agli sviluppatori di tutto il mondo la possibilità di utilizzare, adattare e sviluppare liberamente queste tecnologie innovative.
I tre modelli – Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct e Phi-3.5-vision-instruct – coprono un'ampia gamma di applicazioni, dalle attività di base a quelle altamente complesse. Ogni modello è ottimizzato per esigenze specifiche, come il ragionamento rapido e preciso o l'elaborazione di dati testuali e visivi in compiti di multimodalità.
Il modello Phi-3.5 Mini Instruct, dotato di 3,8 miliardi di parametri, è un modello leggero, sviluppato specificamente per l'uso in ambienti con limiti di memoria o capacità di calcolo. Dimostra prestazioni impressionanti in compiti che richiedono un forte ragionamento, come la generazione di codice, la risoluzione di problemi matematici e le query basate sulla logica. Nonostante le sue dimensioni compatte, supera altri modelli della sua classe, come il Llama-3.1-8B-instruct, nel benchmark RepoQA, soprattutto nei compiti che richiedono la comprensione di contesti lunghi.
Il modello Phi-3.5 MoE (Mixture of Experts) è il primo del suo genere nel portafoglio di Microsoft. Combina diversi tipi di modelli, ciascuno specializzato in compiti differenti, permettendogli di gestire in modo efficiente compiti complessi di IA. Con 42 miliardi di parametri attivi, offre prestazioni scalabili e supporta contesti fino a 128.000 token. Supera in modo impressionante GPT-4o mini nel benchmark 5-shot MMLU in ambiti come STEM, scienze umanistiche e scienze sociali, sottolineando la sua versatilità e potenza.
Il modello Phi-3.5 Vision Instruct integra capacità di elaborazione del testo e delle immagini, rendendolo ideale per compiti come l'elaborazione generale delle immagini, il riconoscimento ottico dei caratteri e i riassunti video. Con il supporto per la lunghezza del contesto di 128k token, questo modello può gestire compiti visivi complessi e multilivello. Microsoft sottolinea che il modello è stato addestrato su una combinazione di set di dati sintetici e pubblicamente disponibili, con un focus su dati di alta qualità e intensivi di ragionamento.
Tutti e tre i modelli della serie Phi-3.5 sono stati rilasciati sotto una licenza MIT, dimostrando l'impegno di Microsoft a supportare la comunità Open Source. Questa licenza permette agli sviluppatori di utilizzare, modificare e distribuire il software liberamente, pur rispettando le esenzioni di responsabilità di Microsoft e degli altri titolari dei diritti d'autore.
Il rilascio dei modelli Phi-3.5 rappresenta un progresso significativo nello sviluppo di intelligenze artificiali multilingue e multimodali. Con questi modelli, Microsoft offre agli sviluppatori la possibilità di integrare capacità di intelligenza artificiale avanzate nelle loro applicazioni, promuovendo l'innovazione sia nel settore commerciale sia in quello della ricerca.